Análisis de sentimiento

De Wikipedia, la enciclopedia libre

Análisis de sentimiento (también conocido como minería de opinión) se refiere al uso de procesamiento de lenguaje natural, análisis de texto y lingüística computacional para identificar y extraer información subjetiva de los recursos. Desde el punto de vista de la minería de textos, el análisis de sentimientos es una tarea de clasificación masiva de documentos de manera automática, en función de la connotación positiva o negativa del lenguaje empleado en el documento.[1]​ Es importante mencionar que estos tratamientos generalmente "se basan en relaciones estadísticas y de asociación, no en análisis lingüístico".[2]

En términos generales, el análisis de sentimiento intenta determinar la actitud de un interlocutor o usuario con respecto a algún tema o la polaridad contextual general de un documento. La actitud puede ser su juicio o evaluación, estado afectivo (o sea, el estado emocional del autor al momento de escribir), o la intención comunicativa emocional (o sea, el efecto emocional que el autor intenta causar en el lector).

Subtareas[editar]

Una tarea básica en análisis de sentimientos es clasificar la polaridad de un texto dado en un documento, una oración, o en un rasgo o característica — si la opinión expresada en un documento, una oración o un rasgo/característica de una entidad es positiva, negativa, o neutra. La clasificación del sentimiento más avanzada, "más allá de la polaridad" busca, por ejemplo, estados emocionales tales como "enfado", "tristeza", o "felicidad".

Los primeros trabajos en esta área incluyen Turney[3]​ y Pang,[4]​ los cuales aplicaron diferentes métodos para detectar la polaridad de críticas de productos y de películas respectivamente. Este trabajo es a nivel de documento. También es posible clasificar la polaridad de un documento en una escala de varios valores, lo cual fue intentado por Pang[5]​ y Snyder[6]​ (entre otros):[5]​ expandiendo la tarea básica de clasificar una crítica de película como positiva o negativa a predecir evaluaciones en una escala de 3 o 4 estrellas, mientras que Snyder[6]​ realizó un análisis en profundidad de críticas a restaurantes, prediciendo evaluaciones para varios aspectos del restaurante dado, tales como la comida y atmósfera (en una escala de 5 estrellas). A pesar de que en la mayoría de los métodos de clasificación estadísticos, la clase neutra es ignorada bajo la suposición de que los textos neutros se encuentran cerca de la frontera del clasificador binario, varios investigadores sugieren que, al igual que en todo problema de polaridad, tres categorías deben ser identificadas. Además, puede ser probado que algunos clasificadores específicos tales como el de Máxima Entropía[7]​ y las SVMs[8]​ se pueden beneficiar de la introducción de la clase neutra y mejorar la precisión global de la clasificación.

Un método diferente para determinar sentimiento es el uso de un sistema de escalado donde a las palabras comúnmente asociadas con un sentimiento negativo, neutro o positivo se les asigna un número asociado en una escala desde -10 a +10 (más negativo hasta más positivo) y cuando una pieza de texto no estructurado es analizada usando procesamiento de lenguaje natural, los subsecuentes conceptos son analizados para un entendimiento de estas palabras y de cómo se relacionan con el concepto. A cada concepto se le otorga entonces una puntuación basada en la forma en que las palabras asociadas con sentimientos se relacionan con el concepto, y su puntuación asociada. Esto nos permite movernos a un entendimiento más sofisticado de los sentimientos basado en una escala de 11 puntos. De forma alternativa, se le puede otorgar a los textos una puntuación por la intensidad de sentimientos positivos y negativos si el objetivo es determinar el sentimiento en un texto en lugar de la polaridad e intensidad general del texto.[9]

Otra dirección de investigación es la identificación subjetivo/objetivo. Esta tarea se define comúnmente[10]​ como clasificar un texto dado (usualmente una oración) en una de dos clases: objetivo o subjetivo. Este problema puede a veces ser más difícil que la clasificación de polaridad:[11]​ la subjetividad de palabras y frases puede depender de su contexto y un documento objetivo puede contener oraciones subjetivas (por ejemplo, un artículo de prensa citando opiniones de personas). Además, como menciona Su,[12]​ los resultados dependen en gran medida de la definición de subjetividad usada al analizar textos. Sin embargo, Pang[13]​ mostró que eliminar las oraciones objetivas de un documento antes de clasificar su polaridad ayudó a mejorar su rendimiento.

Un modelo de análisis más detallista es el llamado análisis de sentimiento basado en rasgos/características.[14]​ Se refiere a determinar las opiniones o sentimientos expresados sobre diferentes rasgos o características de entidades, por ejemplo, de un teléfono celular, una cámara digital, o un banco. Un rasgo o característica es un atributo o componente de una entidad, por ejemplo, la pantalla de un teléfono celular, o la calidad de las fotografías de una cámara. Este problema involucra varios sub-problemas, por ejemplo, identificar entidades relevantes, extraer sus rasgos/características, y determinar si una opinión expresada sobre cada rasgo/característica es positiva, negativa o neutra.[14]​ Es posible encontrar discusiones más detalladas sobre este nivel de análisis de sentimiento en el capítulo "Sentiment Analysis and Subjectivity" del libro "Handbook of Natural Language Processing" de Liu.[15]

Métodos y características[editar]

Los enfoques existentes en análisis de sentimiento se pueden agrupar en cuatro categorías principales: localización de palabras clave, afinidad léxica, métodos estadísticos, y técnicas a nivel de concepto.[16]​ La localización de palabras clave clasifica el texto en categorías de afecto basado en la presencia de palabras de afecto no ambiguas como feliz, triste, asustado, y aburrido.[17]​ Afinidad léxica no solo detecta palabras de afecto obvias, también asigna a palabras arbitrarias una probable “afinidad” a emociones particulares.[18]​ Los métodos estadísticos sacan ventaja de elementos de aprendizaje de máquina tales como análisis de semántica latente, máquinas de vectores de soporte, "bolsa de palabras" y Orientación Semántica — Información Mutua Puntual (ver el trabajo de Peter Turney[3]​ en esta área). Métodos más sofisticados tratan de detectar el poseedor de un sentimiento (o sea la persona que mantiene ese estado afectivo) y el objetivo (o sea la entidad sobre la cual se siente el afecto).[19]​ Para minar la opinión en contexto y obtener la característica sobre la cual se opinó, son usadas las relaciones gramaticales de las palabras. Las relaciones de dependencia gramatical son obtenidas mediante un análisis gramatical profundo del texto.[20]​ A diferencia de las técnicas puramente sintácticas, los enfoques a nivel de concepto sacan ventaja de elementos de representación del conocimiento tales como ontologías y redes semánticas y, por lo tanto, son también capaces de detectar semánticas que son expresadas de manera sutil, por ejemplo, mediante el análisis de conceptos que no transmiten explícitamente información relevante, pero que están implícitamente ligados a otros conceptos que sí.[21]

Existen herramientas de software de código abierto que despliegan técnicas de aprendizaje de máquina, estadísticas, y de procesamiento de lenguaje natural para automatizar el análisis de sentimiento en grandes colecciones de textos, que incluyen páginas web, noticias en línea, grupos de discusión en Internet, críticas en línea, web blogs, y medios sociales.[20]​ Los sistemas basados en conocimiento, en su lugar, hacen uso de recursos de acceso público, por ejemplo, WordNet-Affect,[22]​ SentiWordNet,[23]​ AIN Thesurus[24]​ and SenticNet,[25]​ para extraer la información semántica y afectiva asociada con conceptos del lenguaje natural. El Análisis de Sentimiento también puede ser realizado sobre contenido visual o sea imágenes y videos. Uno de los primeros enfoques en esta dirección es SentiBank[26]​ utilizando una pareja de sustantivo y adjetivo para la representación de contenido visual.

Un componente de análisis humano es necesario en análisis de sentimiento, debido a que los sistemas automatizados no son capaces de analizar tendencias históricas del comentador individual, o la plataforma y a menudo los sentimientos expresados son clasificados de forma incorrecta. La automatización logra aproximadamente un 23% de los comentarios que son clasificados correctamente por humanos.[27]

En ocasiones, la estructura de sentimientos y temas es bastante compleja. Adicionalmente, el problema de análisis de sentimiento es no monotónico con respecto a la extensión de la oración y sustitución de stop-word (compare la oración en inglés THEY would not let my dog stay in this hotel contra I would not let my dog stay in this hotel). Para enfrentar esta cuestión se han aplicado al análisis de sentimiento varios enfoques basados en reglas y basados en razonamiento, incluyendo Programación Lógica Refutable.[28]​ Adicionalmente, existen varias reglas de recorrido de árboles aplicadas a árboles de análisis sintáctico para extraer la realidad de los sentimientos en condiciones de dominio abierto.[29][30]

Evaluación[editar]

La precisión de un sistema de análisis de sentimiento es, en principio, cuánto coincide con juicios humanos. Esto es usualmente medido mediante precisión y recobrado. Sin embargo, de acuerdo a investigaciones evaluadores humanos normalmente están de acuerdo en un 79%[31]​ de las veces. De este modo, un programa acertado un 70% de las veces se comporta casi tan bien como los humanos, a pesar de que tal precisión pueda no sonar impresionante. Si un programa estuviera "bien" el 100% de las veces, los humanos aún estarían en desacuerdo con él alrededor de un 20% de las veces, puesto que están en desacuerdo lo mismo con cualquier respuesta. Es posible aplicar mediciones más sofisticadas, pero la evaluación de sistemas de análisis de sentimientos sigue siendo un asunto complejo. Para las tareas de análisis de sentimiento que devuelven una escala en lugar de juicios binarios, la correlación es una mejor medida que la precisión porque tiene en cuenta cuán cercano es el valor predicho del valor esperado.

Análisis de sentimiento y la Web 2.0[editar]

El 24 de febrero de 2016, Facebook añadió nuevas reacciones que incluyen: Me gusta, Me encanta, Me divierte, Me sorprende, Me entristece y Me Enoja.

El ascenso de los medios sociales tales como blogs y redes sociales ha alimentado el interés en el análisis de sentimientos. Con la proliferación de críticas, calificaciones, recomendaciones y otras formas de expresión en línea, la opinión en línea se ha convertido en una especie de divisa virtual para negocios que buscan comercializar sus productos, identificar nuevas oportunidades y manejar sus reputaciones. Debido a que los negocios intentan automatizar el proceso de filtrar el ruido, entender las conversaciones, identificar el contenido relevante y actuar apropiadamente, muchos están ahora mirando hacia el campo de análisis de sentimientos.[32]​ Para complicar más el asunto, está el ascenso de plataformas de medios sociales anónimas tales como 4chan y Reddit.[33]​ Si la web 2.0 consistía en democratizar la publicación, entonces la nueva etapa de la web pudiera estar basada en democratizar la minería de datos de todo el contenido que está siendo publicado.[34]

Un paso hacia este objetivo se logra mediante la investigación. Varios equipos de investigación en universidades alrededor del mundo se centran actualmente en entender la dinámica de los sentimientos en las comunidades virtuales a través del análisis de sentimiento.[35]​ El proyecto CyberEmotions, por ejemplo, identificó recientemente el papel de emociones negativas en la conducción de discusiones en las redes sociales.[36]

El problema es que la mayoría de los algoritmos de análisis de sentimiento usan términos simples para expresar sentimientos acerca de un producto o servicio. Sin embargo, factores culturales, matices lingüísticos y diferentes contextos hacen extremadamente difícil convertir una cadena de texto escrito en un simple sentimiento a favor o en contra.[32]​ El hecho de que los humanos a menudo no están de acuerdo en el sentimiento de un texto ilustra cuán difícil tarea es que las computadoras lo logren bien. Mientras más corta la cadena de texto, más difícil se vuelve.

A pesar de que las cadenas de texto cortas pueden ser un problema, el análisis de sentimientos aplicado al microblogging ha mostrado que Twitter puede ser visto como un indicador en línea válido de sentimiento político. Los sentimientos políticos de los tuits demuestran una correspondencia cercana con las posiciones políticas de los partidos y personas políticas, indicando que el contenido de los mensajes de Twitter refleja plausiblemente el paisaje político en línea.[37]Werfamous.com es una herramienta gratuita que analiza el análisis de opiniones a través de Internet y Twitter.[38]

Herramientas de análisis del sentimiento[editar]

G-POMS (Google-POMS)
6 dimensiones(Calma, Alerta, Seguro, Vital, Bueno y Feliz)
Google N-gram
Modelo N-gram[39]
Lingmotif
Aplicación de escritorio multiplataforma para usuario final que analiza el sentimiento de un texto de entrada. Devuelve la orientación semántica de textos (ya sea positivo o negativo, y sus niveles). Funciona en inglés y en español.[40]
LIWC
(Linguistic Processes, Psychological Processes, Personal Concerns, Spoken categories)[41]​ 68 categorías de palabras de diferentes tipos que corersponden a constructos significativos psicológicos o lingüísticos, además de una lista de palabras que pertenecen a cada categoría)[42]
POMS
Mood analysis (Tensión-Ansiedad, Depresión-Abatimiento, Ira-Hostilidad, Vigor-Actividad, Fatiga-Inercia)[43]
Opinion Finder
Estado positivo vs. negativo a partir de contenidos de texto[44]

Referencias[editar]

  1. Liu, B. (2007). Web Data Mining. Exploring Hyperlinks, Contents, and Usage Data. Alemania: Springer. p. 412. (requiere registro). 
  2. Weiss, S. (2005). Text Mining. Predictive Methods for Analyzing Unstructured information. (en inglés). EUA: Springer. p. 6. (requiere registro). 
  3. a b Peter Turney (2002). «Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews». Proceedings of the Association for Computational Linguistics. pp. 417-424. arXiv:cs.LG/0212032. 
  4. «Thumbs up? Sentiment classification using machine learning techniques». www.cs.cornell.edu. Consultado el 7 de abril de 2018. 
  5. a b «Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales». www.cs.cornell.edu. Consultado el 7 de abril de 2018. 
  6. a b Snyder, B., & Barzilay, R. (2007). Multiple aspect ranking using the good grief algorithm. In Human Language Technologies 2007: The Conference of the North American Chapter of the Association for Computational Linguistics; Proceedings of the Main Conference (pp. 300-307).
  7. «The importance of Neutral Class in Sentiment Analysis | Datumbox». blog.datumbox.com (en inglés). Consultado el 7 de abril de 2018. 
  8. Schler, Jonathan (2005). «The importance of neutral examples for learning sentiment». IN WORKSHOP ON THE ANALYSIS OF INFORMAL AND FORMAL INFORMATION EXCHANGE DURING NEGOTIATIONS (FINEXIN. Consultado el 7 de abril de 2018. 
  9. Thelwall, Mike; Buckley, Kevan; Paltoglou, Georgios; Cai, Di; Kappas, Arvid (2010). «Sentiment strength detection in short informal text». Journal of the American Society for Information Science and Technology 61 (12): 2544-2558. doi:10.1002/asi.21416. 
  10. Pang, Bo; Lee, Lillian (2008). «4.1.2 Subjectivity Detection and Opinion Identification». Opinion Mining and Sentiment Analysis. Now Publishers Inc. 
  11. Rada Mihalcea; Carmen Banea and Janyce Wiebe (2007). «Learning Multilingual Subjective Language via Cross-Lingual Projections». pp. 976-983. Archivado desde el original el 8 de julio de 2010. 
  12. Fangzhong Su; Katja Markert (2008). «From Words to Senses: a Case Study in Subjectivity Recognition». Archivado desde el original el 15 de febrero de 2017. Consultado el 19 de diciembre de 2014. 
  13. «A sentimental education: Sentiment analysis using subjectivity». www.cs.cornell.edu. Consultado el 7 de abril de 2018. 
  14. a b Liu, Bing. «Opinion Mining, Sentiment Analysis, Opinion Extraction». www.cs.uic.edu. Consultado el 7 de abril de 2018. 
  15. Liu, B. (2010). Sentiment Analysis and Subjectivity. Handbook of natural language processing, 2, 627-666.
  16. Cambria, Erik; Schuller, Björn; Xia, Yunqing; Havasi, Catherine (2013). «New Avenues in Opinion Mining and Sentiment Analysis». IEEE Intelligent Systems 28 (2): 15-21. doi:10.1109/MIS.2013.30. 
  17. Ortony, Andrew; Clore, G; Collins, A (1988). The Cognitive Structure of Emotions. Cambridge Univ. Press. Archivado desde el original el 23 de noviembre de 2015. 
  18. Stevenson, Ryan; Mikels, Joseph; James, Thomas (2007). «Characterization of the Affective Norms for English Words by Discrete Emotional Categories». Behavior Research Methods 39 (4): 1020-1024. Archivado desde el original el 4 de marzo de 2016. Consultado el 19 de diciembre de 2014. 
  19. Kim, S.M. & Hovy, E.H. (2006). «Identifying and Analyzing Judgment Opinions.». Archivado desde el original el 29 de junio de 2011. Consultado el 19 de diciembre de 2014. 
  20. a b Dey, Lipika; Haque, S. K. Mirajul (24 de julio de 2008). Opinion mining from noisy text data. ACM. pp. 83-90. ISBN 9781605581965. doi:10.1145/1390749.1390763. Consultado el 7 de abril de 2018. 
  21. Cambria, Erik; Hussain, Amir (2012). Sentic Computing: Techniques, Tools, and Applications. Springer. 
  22. Carlo Strapparava; Alessandro Valitutti (2004). «WordNet-Affect: An affective extension of WordNet». pp. 1083-1086. Archivado desde el original el 3 de marzo de 2016. 
  23. Baccianella, S., Esuli, A., & Sebastiani, F. (2010, May). Sentiwordnet 3.0: an enhanced lexical resource for sentiment analysis and opinion mining. In LREC (Vol. 10, No. 2010, pp. 2200-2204).
  24. Antonio Ruoto. «The Sentiment of the Infosphere: A Sentiment Analysis Approach for the Big Conversation on the Net». Data Science and Social Research. doi:10.1007/978-3-319-55477-8_20. 
  25. Cambria, Erik; Olsher, Daniel; Rajagopal, Dheeraj (21 de junio de 2014). SenticNet 3: A Common and Common-Sense Knowledge Base for Cognition-Driven Sentiment Analysis (en inglés). Archivado desde el original el 8 de abril de 2018. Consultado el 7 de abril de 2018. 
  26. Damian Borth; Rongrong Ji, Tao Chen, Thomas Breuel and Shih-Fu Chang (2013). «Large-scale Visual Sentiment Ontology and Detectors Using Adjective Noun Pairs». pp. 223-232. Archivado desde el original el 15 de junio de 2021. Consultado el 16 de mayo de 2022. 
  27. «Case Study: Advanced Sentiment Analysis». Consultado el 18 de octubre de 2013. 
  28. Boris Galitsky, Eugene William McKenna. «Sentiment Extraction from Consumer Reviews for Providing Product Recommendations». Consultado el 18 de noviembre de 2013. 
  29. Boris Galitsky, Gabor Dobrocsi, Josep Lluís de la Rosa (2010). «Inverting Semantic Structure Under Open Domain Opinion Mining». FLAIRS Conference. 
  30. Boris Galitsky, Huanjin Chen, Shaobin Du (2009). «Inversion of Forum Content Based on Authors' Sentiments on Product Usability». AAAI Spring Symposium: Social Semantic Web: Where Web 2.0 Meets Web 3.0: 33-38. 
  31. Ogneva, M. «How Companies Can Use Sentiment Analysis to Improve Their Business». Consultado el 13 de diciembre de 2012. 
  32. a b Wright, Alex. "Mining the Web for Feelings, Not Facts", New York Times, 2009-08-23. Retrieved on 2009-10-01.
  33. «Sentiment Analysis on Reddit». Consultado el 10 de octubre de 2014. 
  34. Kirkpatrick, Marshall. " Archivado el 21 de septiembre de 2009 en Wayback Machine., ReadWriteWeb, 2009-04-15. Retrieved on 2009-10-01.
  35. CORDIS. "Collective emotions in cyberspace (CYBEREMOTIONS)", European Commission, 2009-02-03. Retrieved on 2010-12-13.
  36. Condliffe, Jamie. "Flaming drives online social networks ", NewScientist, 2010-12-07. Retrieved on 2010-12-13.
  37. Tumasjan, Andranik; O.Sprenger, Timm; G.Sandner, Philipp; M.Welpe, Isabell (2010). "Predicting Elections with Twitter: What 140 Characters Reveal about Political Sentiment" Archivado el 12 de diciembre de 2020 en Wayback Machine.. "Proceedings of the Fourth International AAAI Conference on Weblogs and Social Media"
  38. Werfamous, motor de búsqueda de sentimientos. "Análisis de sentimientos y motor de búsqueda" Archivado el 14 de agosto de 2018 en Wayback Machine.. "Puntuación de sentimientos"
  39. «Home | Linguistic Data Consortium». www.ldc.upenn.edu (en inglés). Consultado el 7 de abril de 2018. 
  40. «Lingmotif, a Sentiment Analysis desktop application | Tecnolengua». Tecnolengua. Consultado el 9 de abril de 2018. 
  41. «LIWC | Linguistic Inquiry and Word Count». www.liwc.net. Consultado el 7 de abril de 2018. 
  42. «LIWC | Linguistic Inquiry and Word Count». liwc.net. Archivado desde el original el 18 de septiembre de 2015. Consultado el 7 de abril de 2018. 
  43. «MHS Assessments - A leading publisher of scientifically validated assessments». www.mhs.com. Consultado el 7 de abril de 2018. 
  44. «OpinionFinder | MPQA». mpqa.cs.pitt.edu. Consultado el 7 de abril de 2018.